草庐IT

Root DNS 分布

全部标签

Spring Cloud 分布式实时日志分析采集三种方案~

ELK已经成为目前最流行的集中式日志解决方案,它主要是由Beats、Logstash、Elasticsearch、Kibana等组件组成,来共同完成实时日志的收集,存储,展示等一站式的解决方案。本文将会介绍ELK常见的架构以及相关问题解决。Filebeat:Filebeat是一款轻量级,占用服务资源非常少的数据收集引擎,它是ELK家族的新成员,可以代替Logstash作为在应用服务器端的日志收集引擎,支持将收集到的数据输出到Kafka,Redis等队列。Logstash:数据收集引擎,相较于Filebeat比较重量级,但它集成了大量的插件,支持丰富的数据源收集,对收集的数据可以过滤,分析,格式

pytorch分布式训练

1基本概念rank:进程号,在多进程上下文中,我们通常假定rank0是第一个进程或者主进程,其它进程分别具有1,2,3不同rank号,这样总共具有4个进程node:物理节点,可以是一个容器也可以是一台机器,节点内部可以有多个GPU;nnodes指物理节点数量,nproc_per_node指每个物理节点上面进程的数量local_rank:指在一个node上进程的相对序号,local_rank在node之间相互独立WORLD_SIZE:全局进程总个数,即在一个分布式任务中rank的数量Group:进程组,一个分布式任务对应了一个进程组。只有用户需要创立多个进程组时才会用到group来管理,默认情况

FastDfs分布式文件存储系统

FastDfs分布式文件存储系统FastDfs是一个开源的高性能分布式文件系统(DFS)。它的主要功能包括:文件存储,文件同步和文件访问,以及高容量和负载平衡。主要解决了海量数据存储问题,特别适合以中小文件(建议范围:4KBFastDFS是一个开源的轻量级分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别适合以文件为载体的在线服务,如相册网站、视频网站等等。FastDFS为互联网量身定制,充分考虑了冗余备份、负载均衡、线性扩容等机制,并注重高可用、高性能等指标,使用FastDFS很容易搭建一套高性能的文件服务

zookeeper应用之分布式队列

队列这种数据结构都不陌生,特点就是先进先出。有很多常用的消息中间件可以有现成的该部分功能,这里使用zookeeper基于发布订阅模式来实现分布式队列。对应的会有一个生产者和一个消费者。这里理论上还是使用顺序节点。生产者不断产生新的顺序子节点,消费者watcher监听节点新增事件来消费消息。生产者:CuratorFrameworkclient=...client.start();Stringpath="/testqueue";client.create().creatingParentsIfNeeded().withMode(CreateMode.PERSISTENT_SEQUENTIAL).f

【分布式技术专题】「Zookeeper中间件」给大家学习一下Zookeeper的”开发伴侣”—Curator-Framework(基础篇)

CuratorFramework基本介绍CuratorFramework是Netflix公司开源的一套Zookeeper客户端框架,它作为一款优秀的ZooKeeper客户端开源工具,主要提供了对客户端到服务的连接管理和连接重试机制,以及一些扩展功能,它解决了很多ZooKeeper客户端非常底层的细节开发工作。主要的功能包括:连接重连、反复注册Watcher和NodeExistsException异常等,目前已经成为了Apache的顶级项目,是全世界范围内使用最广泛的ZooKeeper客户端之一,PatrickHunt(ZooKeeper代码的核心提交者)以一句“GuavaistoJavawha

常用分布式文件系统(对象存储)对比-SeaweedFS、Minio

常用分布式文件系统,相对比较热门的有Minio,SeaweedFS,FastDFS,ceph。主要对比一下Minio,SeaweedFS。什么是SeaweedFS?SeaweedFS是一种简单的、高度可扩展的分布式文件系统。SeaweedFS是一个非常优秀的由Go语言开发的分布式存储开源项目。它是用来存储文件的系统,并且与使用的语言无关,使得文件储存变得非常方便,它有两个优势:存储数十亿的文件!查看文件速度快!SeaweedFS设计用来有效地存储处理小文件,较大文件可以分块拆分为小文件进行上传。所有文件的元数据不存储在Master节点,而是分散存储在Volume(逻辑卷,存储数据的逻辑结构)中

Zeus IoT : 基于 SpringBoot 的分布式开源物联网大数据平台

ZeusIoT是一个集设备数据采集、存储、分析、观测为一体的开源物联网平台,全球首创基于Zabbix的物联网分布式数据采集架构,具备超百万级物联网设备的并发监控能力,真正具备工业级性能与稳定性的开源物联网大数据中台。ZeusIoT 致力于让设备接入和数据处理变得开箱即用,使物联网企业得以聚焦行业应用开发,极大的缩短物联网系统的开发周期,成为物联网项目提效降本的贴身伴侣。01ZeusIoT解决方案架构开源版本数据采集只需要部署ZabbixServer+IoTServer,数据库:PostgreSQL12+,TDengine2.2.0+ ZabbixWebappZabbixWebapp主要实现了物

【分布式技术专题】「分布式技术架构」MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步

MySQL数据同步到Elasticsearch之N种方案解析,实现高效数据同步前提介绍MySQL和ElasticSearch的同步双写优点缺点针对于缺点补充优化方案MySQL和ElasticSearch的异步双写优点缺点定时延时写入ElasticSearch数据库机制优点缺点开源和成熟的数据迁移工具选型Logstash组件同步数据机制Logstash是什么配置过程**配置Logstash的input插件****配置Logstash的filter插件****配置Logstash的output插件**启动Logstash并确认同步ElasticsearchJDBC同步数据Elasticsearch

Elasticsearch 分布式全文搜索引擎原理解析

作者:禅与计算机程序设计艺术1.简介Elasticsearch是一个开源的分布式全文搜索引擎,它可以近实时地存储、检索数据。本系列文章将从以下几个方面对Elasticsearch进行深入分析:Elasticsearch的主要组成部分索引、类型和映射(Mapping)搜索请求处理流程查询缓存机制Elasticsearch集群容错、高可用性及扩展性Elasticsearch内部模块架构数据统计及分析功能以上将涉及到许多重要的Elasticsearch基础知识,希望通过本系列文章可以帮助读者理解并掌握Elasticsearch的原理与应用。2.Elasticsearch的主要组成部分首先,让我们了解

【Go语言实战】(26) 分布式搜索引擎

Tangseng基于Go语言的搜索引擎github地址:https://github.com/CocaineCong/tangseng详细介绍地址:https://cocainecong.github.io/tangseng这两周我也抽空录成视频发到B站的~本来应该10月份就要发了,结果一鸽就鸽到现在hhhh,有兴趣的同学也可留意一下~项目大体框架gin作为http框架,grpc作为rpc框架,etcd作为服务发现。总体服务分成用户模块、收藏夹模块、索引平台、搜索引擎(文字模块)、搜索引擎(图片模块)。注册到etcd中,并进行服务发现。分布式爬虫爬取数据,并发送到kafka集群中,再落库消费。